阿里开源视频生成模型Wan2.2-S2V 阿里开源多模态视频生成模型通义万相Wan2.2-S2V,仅需一张静态图片和一段音频,即可生成面部表情自然、口型一致的电影级数字人视频。该模型单次生成的视频时长可达分钟级。 电影 视频 音频 模型 开源 2025-08-26 21:54 4